Accès au contenu des thèses numériques par leur structure sémantique

نویسندگان

  • Rocío Abascal-Mena
  • Béatrice Rumpler
چکیده

RÉSUMÉ. Les projets de bibliothèques numériques actuels offrent à l’utilisateur l’accès aux thèses à partir d’une recherche qui ne permet pas d’extraire les parties pertinentes de la thèse et ne renvoie que la thèse intégrale. Ainsi, l’utilisateur doit lire des chapitres entiers pour connaître les parties qui correspondent à son besoin. Le projet CITHER (Consultation en texte Intégral des THèses En Réseau) de l’INSA de Lyon dans lequel s’inscrit cette étude, porte sur la mise en ligne des thèses. Nous proposons de permettre un accès pertinent au contenu des thèses grâce à l’utilisation de « tags sémantiques » rajoutés, par le doctorant, au sein de sa thèse lors de la rédaction. L’exploitation de ces tags permet de cibler la recherche et ainsi mieux satisfaire l’utilisateur. Notre travail porte d’une part sur la constitution d’une base de concepts utilisés pour le « tagage » de la thèse et, d’autre part, sur la définition d’un nouveau modèle de documents à partir des différentes structures de la thèse.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Crawl intelligent et adaptatif d'applications web pour l'archivage du web

RÉSUMÉ. Les sites web sont par nature dynamiques, leur contenu et leur structure changeant au fil du temps; de nombreuses pages sur le web sont produites par des systèmes de gestion de contenu (CMS). Les outils actuellement utilisés par les archivistes du web pour préserver le contenu du web collectent et stockent de manière aveugle les pages web, en ne tenant pas compte du CMS sur lequel le si...

متن کامل

Indexation de photos géoréférencées à l'aide du web participatif

RÉSUMÉ. La démocratisation des appareils photo numériques et l’intégration de capteurs numériques dans les téléphones mobiles permettent à chacun de prendre de nombreuses photos. Or, des plateformes de partage de photos, telles que Panoramio et Flickr, offrent la possibilité de les stocker, de les étiqueter avec des tags et de les partager. Ainsi, plus de 4 millions de photos sont publiées sur ...

متن کامل

TLabel: Nouvel opérateur d'agrégation par catégorisation dans les cubes de textes

Résumé. L’analyse en ligne (OLAP) dans les cubes de textes nécessite la définition de nouveaux types d’opérateurs d’analyse appropriés aux données textuelles. En effet, les opérateurs d’agrégation classiques ont montré leur efficacité pour l’analyse en ligne des données numériques, mais ils sont inadaptés pour l’analyse des données textuelles. Dans cet article, nous proposons un nouvel opérateu...

متن کامل

Le Web sémantique n'est pas antisocial

Une série d'articles stimulants [5][6][31][32] a défendu l'importance de la dimension sociale dans la construction d'un cycle de vie du Web sémantique et propose une nouvelle approche (le Web socio-sémantique) que les auteurs opposent radicalement, à l' approche classique du Web sémantique. Loin de remettre en cause cette importance, cet article reprend ici le discours de ces contributions et m...

متن کامل

Les défis posés par le Web sémantique

RÉSUMÉ. Le Web sémantique est une vision du Web de demain où l'interopérabilité entre les ressources distribuées sur le Web, aujourd'hui très hétérogènes, sera facilitée par un marquage sémantique de ces ressources à l'aide d'ontologies. Une ontologie est un vocabulaire structuré de noms de concepts et de propriétés définis précisément à l'aide d'un langage formel non ambigu. Dans la vision du ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Document Numérique

دوره 10  شماره 

صفحات  -

تاریخ انتشار 2007